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(54) Bezeichming: VERFAHREN ZUR GLEICHZEITIGEN IDENTIFIZIERUNG VON PROTEINEN UND IHREN BINDUNGSPART- 
NERN 



(57) Abstract 

The invention relates to a method for simultaneous identification of a protein and its binding partners, characterised in that a) proteins 
or aggregates of proteins from a biological source are isolated and separated, b) the separated proteins or aggregates of proteins are 
immobilized on a surface, c) a combinatory bank is incubated with proteins or aggregates of proteins immobilized on a surface, d) the 
members of the combinatory bank which bond with the immobilized proteins are separated from non-bonded members of said bank, e) the 
surface bonded complexes made of protein and bonding partners from the combinatory bank are isolated, 0 the proteins in the complexes 
thus isolated are identified according to a mixed physical-chemical process and g) the isolated bonding partners are optionally enriched. 
The invention enables simultaneous identification of proteins with or without prior purification, and makes it possible to select members of 
combinatory banks which interact with said proteins. This allows the function of said proteins to be determined in a simple manner, using 
their specific bonding partners. 



(57) Zusammenfassung 

Die Erfindung betrifft Verfahren zur gleichzeitigen Identifizierung eines Proteins und seines Bindungspartners, das dadurch 
gekennzeichnet ist, daB man a) Proteine oder Proteinaggregate aus einer biologischen Quelle isoliert und auftrennt; b) die aufgetrennten 
Proteine oder Proteinaggregate auf einer Oberfiache immobilisiert; c) eine kombinatorische Bank mit den auf einer Oberfiache immobilisierten 
Proteinen oder Proteinaggregaten inkubiert; d) diejenigen Mitglieder der kombinatorischen Bank, die an die immobilisierten Proteine binden, 
von nicht-gebundenen Mitgliedem der Bank trennt; e) die an die Oberfiache gebundenen Komplexe aus Protein und Bindungspartner aus der 
kombinatorischen Bank isoliert; 0 die Proteine in den so isolierten Komplexen mit einer Kombination aus einem physikalisch-chemischen 
Verfahren identifiziert; und g) gegebenenfalls die isolierten Bindungspartner anreichert. Die vorliegende Erfindung erlaubt somit die 
gleichzeitige Identifizierung von Proteinen mit und ohne vorherige Reinigung, sowie die Auswahl von Mitgliedem kombinatorischer 
Banken, die mit diesen Proteinen wechselwirken. Dadurch lafit sich auf einfache Weise die Funktion der Proteine uber ihre spezifischen 
Bindungspartner ermitteln. 
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Verfahren zur gleichzeitigen identifizierung von Proteinen und ihren Bindungs- 
partnern 

Die Erfindung betrifft ein Verfahren zur gleichzeitigen Identifizierung von Protei- 
nen und ihren spezifischen Bindungspartnern. Insbesondere betrifft die Erfindung 
ein Verfahren zur gleichzeitigen Identifizierung aller Proteine einer biologischen 
Quelle und ihrer entsprechenden Bindungspartner und somit die gleichzeitige 
Aufklarung von Struktur und Funktion aller Proteine aus einer biologischen 
Quelle. 

Fortschritte in dem Humangenomprojekt f uhrten zu einer nahezu unubersehbaren 
Menge von Daten aus den Genomen verschiedenster Organismen. Das voll- 
standige Genom des Menschen wird vermutlich im Jahr 2003 sequenziert sein. 
Gegenwartig ist das Genom von elf Mikroorganismen entschlusselt. Eine genom- 
ische Sequenz erlaubt jedoch keine Aussage dahingehend, ob gegebene Proteine 
tatsachlich exprimiert werden, und wie sie im biologischen Gewebe funktionie- 
ren. Da die Proteine als die tatsachlichen funktionellen Gegenstucke der Gene 
den jeweiligen biologischen Zustand ihres Wirts bestimmen, spiegelt eine direkte 
Identifizierung der Proteine viel genauer den Zustand der biologischen Quellen 
des Wirts (i.e. des jeweiligen aktiven Genoms) wieder als die entsprechenden 
Gensequenzen. 

Die Sequenzierung der mRNAs uber cDNAs oder uber Codesequenzen fur die 
Expression (Expression Sequence Tags; ESTs) ergibt eine potentielle Korrelation 
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zwischen den in einer biologischen Quelle produzierten mRNAs und ihren Protei- 
naquivalenten. Dieses Vorgehen wird gegenwartig an haufigsten angewendet. 
Jedoch entspricht bekanntlich die Genexpression nicht vollig der mRNA-Produk- 
tion. So enthalten ESTs RNA-Spleifcintermediate, und der endgultige mRNA- 
Gehalt hangt entscheidend von der Stabilitat der mRNAs ab. Aufgrund von 
Unterschieden in der Translationshohe, der Stabilitat, des Spleifcmusters, post- 
transkriptioneller und posttranslationeller Modifikationen kann das Proteinend- 
produkt meist nicht aus den entsprechenden mRNAs oder ESTs vorhergesagt 
werden. Beispielsweise wurde ein Korrelationsfaktor von 0,43 (i.e. keine Ent- 
sprechung im Verhaltnis eins zu eins) zwischen der gebildeten mRNA und der 
tatsachlichen Menge an GST-/7-Protein, das in den verschiedenen Geweben 
exprimiert wird (Anderson, L., IBC's International Conference on proteomics, 
Boston, MA, 1997). Auf ahnliche Weise fand sich keine Korrelation zwischen 
der mRNA-Produktion und dem Vorkommen der Proteine unter 23 in der mensc- 
hlichen Leber gebildeten Proteinen (Large Scale Biology) 

Um die Funktion unbekannter Proteine zu identifizieren wurden verschiedene 
Methoden angewendet. Beispiele hierfur sind der Vergleich unbekannter Proteine 
mit sequenzhomologen Proteinen ahnlicher Funktion, Antisense-Technik, Knock- 
out-Tiermodelle oder der Einsatz transgener Tiere. Jedoch laRt sich mit diesen 
Methoden die Funktion interessierender Proteine nicht direkt identifizieren (z.B. 
beim homologen Vergleich), oder das Verfahren ist aufwendig, zeitraubend und 
damit wenig geeignet fur ein Massenscreening (z.B. bei Knock-out oder trans- 
genen Tieren). 
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Proteinproben lassen sich mittels 2D-Gelelektrophorese auftrennen, und die 
Proteine konnen mittels Massenspektrometrie in Kombination mit EST- und 
Protein-Datenbankrecherchen identifiziert und bestatigt werden. Je mehr ESTs 
ermittelt werden, desto leichter wird es moglich, das Protein in voller Lange nur 
uber Peptidfragmente zu identifizieren. Jedoch fuhrt die Identifikation der Protei- 
ne und ihrer Modifikationen nicht zur Ermittlung ihrer Funktion. 

Die Funktion einiger Proteine kann uber ihre Wechselwirkung mit anderen 
Proteinen, deren Funktion bekannt ist, bestimmt werden. Methoden wie die 
Hefe-zwei-Hybrid-Technik (Phizicky, E.M. und Fields, S., Microbiological Rev., 
59:94-123, 1995) und die Phagendisplay-Technik (Hag, V. und Ge, L., PCT/- 
EP97/00931, 1996) fur ein wechselseitiges Absuchen von Genbanken konnen 
angewendet werden, um derartige Wechselwirkungen zu ermitteln. Beispiels- 
weise bietet das Hefe-zwei-Hybrid-Verfahren die Moglichkeit, Proteine und ihre 
Wechselwirkungen in einem eukaryotischen Wirt zu untersuchen; das Verfahren 
besitzt jedoch den Nachteil, dafc die Wechselwirkung nur im Hefezellkern statt- 
findet und nur auf nicht-sezernierte Proterne angewendet werden kann. Obwohl 
das Phagen-Display-Verfahren diese Probleme uberwindet, ist nicht zu erwarten, 
daB die Proteine in ihrer nativen Form vorliegen, da moglicherweise posttrans- 
lationelle Modifikationen stattfinden. 

Die am haufigsten verwendete funktionelle Analyse beruht auf immunologischen 
Methoden, z.B. histochemische Analyse, FACS oder Immunprazipitation. Wegen 
ihrer hohen Spezifitat und Affinitat werden am haufigsten Antikorper eingesetzt. 
So konnen Liganden-Rezeptor-Wechselwirkungendurch blockierende Antikorper 
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blockiert werden. Jecloch konnen unter Verwendung herkommlicher Methoden 
Antikorper nur gegen fremde Antigene erzeugt werden. Beispielsweise ist es 
schwierig oder sogar unmoglich, menschliche Antikorper zu erzeugen, die in auf 
Antikorpern beruhenden Therapien gegen Antigene menschlichen Ursprungs 
nutzlich sind. Antikorper sind jedoch in der Herstellung und Reinigung teuer und 
aufwendig. 

Um die entsprechenden Bindungspartner fur ein Antigen zu ermitteln, werden 
Proteinbanken, insbesondere Antikorperbanken (einkettiges Fv/scFV und Fab), 
und Peptidbanken funktionell auf der Oberflache von filamentosen Bakterio- 
phagenteilchen in einem Phagen-Display-System exprimiert (vgl Smith, G.P., 
Science, 228: 1315-1317, 1985). Die scFvs, Fabs, Proteine oder Peptide 
werden an eine Komponente eines Oberflachenproteins des Phagen fusioniert, 
wodurch die Bindung des interessierenden scFvs, Fabs, Proteins oder Peptids 
stattfinden kann. Die Gene, die die prasentierten Proteine codieren, werden in 
die Phagenteilchen verpackt, und so binden die Proteinprodukte direkt an ihre 
genetische Information. Menschliche scFv-Phagenbanken wurden zur Isolierung 
therapeutisch wichtiger Antikorper vielfach verwendet (vgl. Vaughan, T.J, et al., 
Nature Biotechnol. 14:309-314, 1996). 

Es konnte auch gezeigt werden, date Antikorper mit hoher Affinitat und Spezifi- 
tat gegen Selbstantigene aus den menschlichen kombinatorischen Antikorper- 
bank isoliert werden konnen (Griffiths A.D. et al.,EMBL J., 1 2:725-734, 1993). 
Jedoch sind bei all diesen Technologien gereinigte Proteine in betrachtlicher 
Menge erforderlich, wodurch sie nur auf die in groliter Menge vorkommenden 
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Proteine oder Proteine, die rekombinant hergestellt werden konnen, angewendet 
werden konnen. Obwohl es moglich ist, Antikorper oder Peptide gegen Proteine 
auf der Zelloberflache zu richten, muB die Identitat dieser Proteine bekannt sein. 

Die WO 94/26787 und die WO 97/22972 beschreiben die Isolierung von Anti- 
korpern aus kombinatorischen Antikorperbanken gegen nicht gereinigte und 
zuvor nicht identifizierte Zelloberflachenantigene bzw. intrazellulare krankheits- 
spezifische Antigene. Nach dem Verfahren gemalS der WO 94/26787 konnen 
jedoch nur Zelloberflachenantigene ermittelt werden; die unbekannten Antigene 
konnen nicht direkt identifiziert werden. Bei dem Verfahren gemafc der WO 97/2- 
2972 mussen zuerst antigenspezifische Antikorper aus einem SelektionsprozeB 
verfugbar gemacht werden. Daher mussen in einer ersten Stufe antigenspezifi- 
sche Antikorper selektioniert werden, bevor die unbekannten Antigene iden- 
tifiziert werden konnen. 

Es besteht somit ein Bedarf nach einem Verfahren, alle in einer ausgewahlten 
biologischen Quelle produzierten Proteine direkt abtrennen und funktionell 
identifizieren zu konnen. Mit einem derartigen Verfahren lieBen sich alle Proteine, 
die den Phanotyp der biologischen Quelle, z.B. Gewebe, Mikroorganismen, 
Zellkulturen etc. bestimmen, direkt identifizieren und funktionell charakterisieren. 

Der vorliegenden Erfindung liegt daher die Aufgabe zugrunde, ein Verfahren 
bereitzustellen, mit dem gleichzeitig Proteine und ihre spezifischen Bindungs- 
partner aus einer kombinatorischen Bank isoliert werden konnen, ohne daft eine 
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vorherige Trennung, Reinigung und Identifizierung der Proteine erforderlich sind. 
Mit dem Verfahren sollen alle Proteine aus einer biologischen Quelle funktionell 
erfafct werden konnen. Es soil also der Proteomstatus einer biologischen Probe 
ermittelt werden konnen. Das Verfahren soil auf alle moglichen Bindungspartner 
eines Proteins anwendbar sein. Ferner soli das Verfahren zusatzlich die Identi- 
fizierung der funktionell charakterisierten Proteine erlauben. Das Verfahren soli 
einfach, schnell und kostengunstig durchzuf uhren sein und sich fur ein Massens- 
creening und zur Automatisierung eignen. Ferner soil das erfindungsgemafce 
Verfahren eine rasche, eindeutige und einfache Diagnostik von Stoffwechsel- 
krankheiten sowie die Identifizierung von Arzneimittelwirkungen erlauben. Mit 
dem erfindungsgemafcen Verfahren soil eine Datenbank aus Proteinen und ihrem 
jeweiligen spezifischem Bindungspartner erstellt werden konnen. Diese Daten- 
bank soli die Ermittlung von Arzneimittelprototypen unterstutzen. 

Diese Aufgabe wird erfindungsgemafS durch ein Verfahren zur gleichzeitigen 
Identifizierung eines Proteins und seines Bindungspartners gelost, das dadurch 
gekennzeichnet ist, daS man 

a) Proteine oder Proteinaggregate aus einer biologischen Quelle isoliert und 
auftrennt, 

b) die aufgetrennten Proteine oder Proteinaggregate auf einer Oberflache 
immobilisiert, 

c) eine kombinatorische Bank mit den auf einer Oberflache immobilisierten 
Proteinen oder Proteinaggregaten inkubiert, 

d) diejenigen Mitglieder der kombinatorischen Bank, die an die immobili- 
sierten Proteine binden, von nicht-gebundenen Mitgliedern der Bank trennt, 
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e) die an die Oberflache gebundenen Komplexe aus Protein und Bindungs- 
partner aus der kombinatorischen Bank isoliert, 

f) die Proteine in den so isolierten Komplexen mit einer Kombination aus 
einem physikalisch-chemischen Verfahren identifiziert, und 

g) gegebenenfalls die isolierten Bindungspartner anreichert. 

Bevorzugt wird das Verfahren derart durchgefuhrt, dalS man bei Schritt a) die 
biologische Probe in einem geeigneten Puffer solubilisiert und die Probe unter 
Verwendung eines Proteintrennverfahrens ausgewahlt aus 2D-Gelelektro~pho- 
rese, Perfusionschromatographie, Flussigchromatographie oder Kapillarelektro- 
phorese auftrennt. Weiter bevorzugt werden die aufgetrennten Proteine auf den 
Kavitaten einer Mikrotiterplatte immobilisiert oder auf eine Membran geblottet 
oder mit mit spezifischen Antikorpern beschichteten Mikrokugelchen eingefan- 
gen. 

Der Ausdruck Proteinaggregate bezeichnet einen Zusammenschlufc mehrerer 
Proteine. Dieser Zusammenschlufc kann das Ergebnis einer funktionellen Assozia- 
tion mehrerer Proteine sein, z.B. Enzyme des Krebs-Zyklus, die zu einer funktio- 
nellen Einheit verbunden sind, an der die Umwandlung des Substrats in das 
Endprodukt uber mehrere Zwischenstufen erfolgt. Der ZusammenschluB kann 
aber auch das Ergebnis des Trennverfahrens sein, und umfaSt z.B. in einem 
chromatographischen Peak eluierende Proteine, die durch eine gemeinsame 
Retentionszeit verbunden sind. 

Bevorzugt verwendet man als kombinatorische Bank Random-Peptid-Banken, 
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(scFv)Banken der Immunglobulinsuperfamilie, Protein-Display-Banken, kom- 
binatorische chemische Banken, RNA- oder DNA-Banken. Bevorzugt wird Schritt 
g) so durchgefuhrt, dafc man einen bakteriellen Wirt mit den isolierten Proteinen 
infiziert, urn ausgewahlte Phagenteilchen zu vermehren, und die ausgewahlten 
Proteinbindungspartner sequenziert, oder die ausgewahlten Bindungspartner 
durch einzigartige Sequenzanknupfungen (tag) identifiziert. 

Uberaschenderweise wurde gefunden, dafc Proteine und ihre Bindungspartner 
gleichzeitig identifiziert werden konnen, wenn man ohne vorherige Reinigung 
und Identifzierung Proteine nach Auftrennung mit einer kombinatorichen Bank 
inkubiert und die so erhaltenen Komplexe aus Protein und Bindungpartner einem 
physikalisch-chemischen Identifizierungsverfahren unterwirft. 

Da sich erfindungsgemalS die Proteinproben direkt von ihren biologischen Quellen 
ableiten, wird keine teure, zeitaufwendige oder risikobehaftete Proteinproduktion 
benotigt. Da der Selektionsschritt in einer Stufe erfolgt, werden keine Anreiche- 
rung der Bank oder eine anschlieBende Selektion benotigt. Das erfindungsgema- 
£e Verfahren eignet sich daher ideal zur Produktion von proteinspezifischen Anti- 
korpern oder Peptiden in gro&em Umfang. Ferner kann jede kombinatorische 
Bank eingesetzt werden. 

Da die aufgetrennten Proteine/Proteinkomplexe direkt aus dem Gel oder in 
immobilisierter Form unter Verwendung von Massenspektrometrie identifiziert 
werden konnen, kann das Verfahren der Proteinidentifizierung und Erzeugung 
proteinspezifischer Subbanken als paralleles Verfahren durchgefuhrt werden. 
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Dadurch eignete sich das erfindungsgemalSe Verfahren fur Proteinidentifizierun- 
gen in gro&em Umfang. 

Das erfindungsgemafte Verfahren kann mit jeder beliebigen kombinatorischen 
Bank durchgefuhrt werden, z.B. Proteinbank, Peptidbank, cDNA-Bank, mRNA- 
Bank, Bank mit organischen Molekulen, scFv-Bank mit Immunglobulinsuperfami- 
lie, Proteindisplay-Bank etc.. In den Banken konnen prasentiert sein: alle Arten 
von Proteinen, z.B. Strukturproteine, Enzyme, Rezeptoren, Liganden, alle Arten 
von Peptiden einschlie&lich Modifikationen, DNAs, RNAs, Kombinationen von 
DNAs und RNAs, Hybride von Peptiden und RNA oder DNA, alle Arten von 
organischen Molekulen, z.B. Steroide, Alkaloide, Naturstoffe, synthetische 
Stoffe etc. Die Presentation kann auf verschiedene Arten erfolgen, z.B. als 
Phagen-Display-System (z.B. filamentose Phagen wie M13, fl,fd etc., lambda- 
Phagen-Display, virales Display etc.), Presentation auf Bakterienoberflachen, 
Ribosomen etc. 

Die kombinatorische Bank kann hergestellt werden durch: 

a) Konstruktion von Random-Peptid-Banken, in denen Banken prasentiert 
werden konnen, 

b) Konstruktion von scFv-Banken oder Banken von beliebigen Mitgliedern der 
Immunglobulin-Superfamilie, in denen Mitglieder der Banken prasentiert 

werden konnen, 

c) Konstruktion von Proteinbanken, in denen Proteine prasentiert werden 
konnen, 

d) Konstruktion von kombinatorischen chemischen Banken, in denen organi- 
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sche Molekule der Banken prasentiert werden konnen, 
e) Konstruktion von RNA- oder DNA-Banken in denen die ausgewahlten Mit- 
glieder der Banken isoliert und uber geeignete Oligoprimer amplifiziert 
werden konnen. 

Derartige Verfahren sind einem Fachmann auf dem Gebiet bekannt. 

Die erfindungsgemalS zu identifizierenden Proteine konnen aus jeder biologischen 
Quelle stammen, z.B. aus gesunden oder erkrankten Geweben, Zellkulturen, 
Organpraparaten, Korperflussigkeiten, Biopsieproben aller Art, Organkulturen, 
Mikroorganismen, Pflanzenpraparate, etc. 

Die vorliegende Erfindung erlaubt somit die gleichzeitige Identifizierung von 
Proteinen mit und ohne vorherige Reinigung, sowie die Auswahl von Mitgliedern 
kombinatorischer Banken, die mit diesen Proteinen wechselwirken. Dadurch lafct 
sich auf einfache Weise die Funktion der Proteine uber ihre spezifischen Bin- 
dungspartner ermitteln. 

Die Identifizierung von Proteinen einer Expressionsfamilie erganzt oder ersetzt 
sogar das Verfahren zur Identifizierung von Genen: Die Identifizierung von 
Proteinen in ihrem nativen Zustand bestatigt die entsprechenden Gensequenzen 
oder identifiziert mogliche posttranskriptionelle und posttranslationelle Modifika- 
tionen. Die Identifizierung der meisten oder aller Proteine aus einer nicht sequen- 
zierten oder teilweise sequenzierten biologischen Probe beschleunigt Bemuhun- 
gen zur Ermittlung einer Genzielsequenz oder vermeidet den aufwendigen Prozefc 
der Gensequenzierung. Die Information auf der Proteinebene spiegelt die biologi- 
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sche Identitat eines Organismus besser wieder als die Information auf genom- 
ischer Ebene. So spiegelt die Identifizierung aller Proteine einer biologischen 
Probe die relevante Information uber den biologischen Zustand der Probe und 
damit des untersuchten Organismus bzw. Teil des Organismus wieder. Ferner ist 
zu erwarten, date die Variation im Vorkommen eines Proteins dynamisch ist, i.e. 
sie wird von endogenen und exogenen Faktoren beeinfluBt. Es ist nicht moglich, 
diese Zusatzinformation aus der Sequenzierung des Genoms oder der mRNA 
abzuleiten (s.o.). 

Ferner konnen erfindungsgemafc spezifisch miteinander wechselwirkende Mit- 
glieder einer kombinatorischen Bank gegen die meisten oder gar alle Proteine 
einer gegebenen biologischen Probe gleichzeitig ermittelt werden. Dies ersetzt 
das aufwendige Verfahren der Genisolierung, Subklonierung, Expression und 
Reinigung des rekombinanten Proteins. Ferner ist es mit den gegenwartigen 
bekannten Methoden nicht nur aufwendig und schwierig, spezielle Mitglieder 
einer kombinatorischen Bank gegen ein Protein zu isolieren, sondern es ist auch 
unsicher, ob alle Proteine exprimiert werden konnen und ob die exprimierten 
Proteine tatsachlich in ihrer nativen Form vorliegen. Beispielsweise ist gut 
bekannt, dafc das Glycosylierungsmuster von Proteinen eukaryotischen Ur- 
sprungs entscheidend von den zur Expression gewahlten Wirten abhangt. Ferner 
ist es praktisch nicht moglich, spezifisch wechselwirkende Mitglieder einer Bank 
gegen die meisten oder alle Proteine aus komplizierten biologischen Proben 
gleichzeitig unter Verwendung bisher bekannter Methoden zu erhalten. 

Diese Kombinationen aus Protein und spezifischem Mitglied einer kombinatori- 
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schen Bank kann verwendet werden, um den Proteomstatus der Probe und nicht 
nur von einigen wenigen Proteinen gleichzeitig zu uberwachen. Dieser Fortschritt 
in der Proteomuberwachung soil die Ermittlung von Angriffsorten von Arznei- 
mitteln und von pharmazeutischen Leitsubstanzen zur Weiterentwicklung zu 
Arzneimitteln beschleunigen, da die meisten Erkrankungen, die gegenwartig 
therapiert werden, multifaktorieller Genese sind, d.h. mehr als ein Protein an 
ihrer Genese beteiligt ist. 

Ferner ermoglicht die vorliegende Erfindung die Anwendung jeder kombinatori- 
schen Bank, z.B. Protein-, Peptid- oder Antikorperbanken oder DNA- und RNA- 
Banken oder sogar mit einer Codesequenz versehene synthetische organische 
Molekulbanken (Brenner, S. und Lerner, R.A., Proc. Natl. Acad. Sci. USA, 
89,5381-5383, 1 992). Die Erfindung besitzt somit beispielsweise die folgenden 
technischen Anwendungsmoglichkeiten: 

a) Isolierung von Proteinen, die fur Proteine aus einer biologischen Probe 
spezifisch sind, und Erstellung einer Protein-Protein-Wechselwirkungsbank 
(z.B. Netzwerk von signalubertragenden Stoffwechselwegen, wenn Protei- 
ne der kombinatorischen Bank von der gleichen biologischen Quelle stam- 
men wie die Probe) oder einer Krankheitserreger-Wirt-Datenbank (z.B. 
wenn Proteine der kombinatorischen Bank dem Krankheitserreger angeho- 
ren und die Probe der Wirt ist), 

b) Isolierung und Identifizierung proteinspezifischer Peptide, mit dem Ziel der 
Ermittlung potentieller Peptid-agonisten oder -antagonisten oder peptido- 
mimetischer Molekule zum Design von neuen Arzneimitteln, 

c) Isolierung und Identifizierung rekombinanter Antikorper mit den vorste- 
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hend genannten Anwendungsspektren, 

d) Isolierung und Identifizierung proteinspezifischer DNA- oder RNA-Moleku- 
le, die fur Anwendungen von Protein-Knock-out zur Funktionsermittlung 
bis zur Arzneimittel-entwicklung geeignet sind, und 

e) Isolierung und Identifizierung kleiner organischer Molekule, die direkte 
Molekule fur die Entwicklung von Anzneimitteln sind. 

Es ist klar, daS das erfindungsgema&e Verfahren nicht nur das Verstandnis 
biologische Prozesse beschleunigt, sondern auch die Aufklarung von Krankheits- 
mechanismen und die gezielte Entwicklung neuer Arzneimittel beschleunigt. 

Ferner erlaubt das erfindungsgemafce Verfahren eine einfache und rasche Dia- 
gnose von Stoffwechselerkrankungen. Gegenwartig wird Diagnostik nur an 
einem speziellen Protein oder Stoffwechselprodukt durchgefuhrt. Bezuglich 
Erbkrankheiten werden nur ganz spezielle Mutationen in einem Gen getestet, 
jedoch mit unsicherer Aussagekraft. Obwohl es moglich ist, eine Diagnostik mit 
mehreren Proteinen oder Metaboliten durchzufuhren, sind derartige Verfahren 
teuer und zeitaufwendig und erlauben nur eine begrenzte Information uber die 
Krankheit. Die Uberwachung des Proteomstatus einer biologischen Probe 
erlaubt - wie vorstehend ausgefuhrt - die Feststellung des aktuellen Zustands in 
einem biologischen Gewebe. Mit dem erfindungsgema&en Verfahren kann nun 
der Proteomstatus eines Gewebes einfach, schnell und zuverlassig ermittelt 
werden. Dazu wird nach dem erfindungsgemafSen Verfahren eine proteinspezifi- 
sche Bank oder Subbank eines Gewebes, z.B. der Leber, der Lunge, des Magens 
etc. erzeugt und gegebenenfalls vielfach amplifiziert. Eine derartige Bank wird 
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dann auf einer geeigneten Oberflache, z.B. aus Glas, Kunststoff, einem Halblei- 
terchip einer optischen Faser oder einer CD in an sich bekannter Weise immobili- 
siert. Die Bindung der Proteine an ihre verwandten Subbanken, die auf der 
geeigneten Oberflache immobilisiert sind, konnen unter Verwendung bereits 
bekannter Nachweisverf ahren, nachgewiesen werden z.B. BIAcore-Chips. 
Umgekehrt kann auch die biologische Probe auf der Oberflache eines derartigen 
Chips immobilisiert werden. Die Oberflache selbst wird bevorzugt in mehrere Mi- 
krokompartimente unterteilt, wobei jede Unterteilung einem speziellen Protein 
zugeordnet wird, dessen kombinatorische Subbank zuvor erzeugt worden ist. 
Nach Abwaschen uberschussiger nicht gebundener Probenlosung werden die 
proteinspezifischen Antikorper- oder Proteinsubbanken jedem Kompartiment 
zugesetzt. Die gebundenen Antikorper oder Peptide konnen durch ihre fusionier- 
ten Peptid-Tags identifiziert werden. Aus den so erhaltenen Signalen (qualita- 
tiv/quantitativ) kann dann durch Vergleich mit dem Signalmuster einer normalen 
Probe auf eine entsprechende Erkrankung des Gewebes bzw. Organs geschlos- 
sen werden. Derartige Diagnosechips konnen zur Diagnose von Organ- und 
Gewebszustanden, Infektionen und Krankheiten aller Art gezielt angefertigt 
werden. Ferner kann ein solcher Chip auch zur Untersuchung von Stoffwechsel- 
zustanden in Pflanzen, Mikroorganismen etc. verwendet werden. So lassen sich 
mit einem solchen Chip gezielt und rasch Zustande wie ein frischer Herzinfarkt, 
ein Magengeschwiir, eine Gewebsnekrose, Infektionen wie z.B. Hepatitis, 
Tropenkrankheiten, AIDS, Autoimmunerkrankungen aller Art etc. diagnostizieren. 

Ein derartiger Diagnosechip kann in Form eines gebrauchsfertigen Kits angeboten 
werden. Ein derartiges Kit umfa&t einen entsprechenden gewebs- bzw. organ- 
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spezifischen Chip, auf den eine entsprechende Proteinbank immobilisiert ist, eine 
Ausrustung zur Probenahme, z.B. Spritze, Skalpell etc. sowie ein Gefafc zur 
Durchfuhrung der Inkubation zwischen Chip und Probe und Anleitungen zur 
Durchfuhrung und Auswertung. Entsprechende gebrauchsfertige Kits konnen 
gezielt hergestellt werden. 

Bei dem erfindungsgema&en Verfahren wird zuerst die Proteinprobe aus der 
jeweiligen biologischen Quelle solubilisiert und aufgetrennt. Hierzu kann jedes 
auf dem Gebiet der Proteinabtrennung einem Fachmann bekannte Verfahren 
verwendet werden. Bevorzugt ist die 2D-Gelelektrophorese. Die so aufgetrennte 
Proteinprobe wird anschliefcend auf eine Oberflache, bevorzugt eine Membran, 
geblottet. Es ist nicht notwendig, die Proteine in dieser Stufe zu identifizieren. 

Als nachster Schritt wird eine kombinatorische Bank z.B. aus einem Peptid oder 
antikorperartigen Molekiilen oder Proteinen, die auf der Oberflache von filamen- 
tosen Phagenteilchen exprimiert sind, mit der Membran, auf die die aufgetrenn- 
te Proteinprobe geblottet ist, inkubiert. Die Inkubation kann nach einem Fach- 
mann bekannten Bedingungen durchgefuhrt werden. Die kombinatorische Bank 
kann z.B. durch kombinatorische chemische Methoden wie randomisierte Oligo- 
kassetten, hergestellt werden und aus jeder biologischen Quelle (z.B. cDNA oder 
Antikorper aus immunisierten Tieren) isoliert werden. Die Inkubationsbedingun- 
gen werden dabei so gewahlt, dad ein Teil der Proteine in der Bank an die 
einzelnen Proteine in der aufgetrennten Probe bindet. Die speziell auf den 
jeweiligen Fall anzuwendenden Bedingungen konnen von einem Fachmann durch 
einfache Routineversuche ermittelt werden. 
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GemaB einer weiteren Ausfiihrungsform werden Proteine, Peptide oder antikor- 
perartige Molekiile, die in einem in vitro in einem Polysom-Display-System 
(Mattheakis, L.C. et al., Proc. Natl. Acad. Sci. USA, 91, 9022-9026, 1994) 
prasentiert sind, oder DNA- oder RNA-Molekulbanken, die mittels SELEX oder 
ahnlichen Systemen (Tuerk, C, und Gold, L. Science, 249: 505-510, 1990) 
erzeugt wurden, oder kombinatorische Banken organischer Molekiile mit den 
getrennten immobilisierten Molekiilen inkubiert. Die Inkubation wird so ausge- 
fuhrt, dafc ein Teil der Mitglieder der Bank an die einzelnen getrennten Proteine 
in der Probe bindet. 

Anschliefcend wird die Membran grundlich gewaschen, um zu gewahrleisten, 
daB nur die Mitglieder der Bank, die fur die getrennten Proteine spezifisch sind, 
haften bleiben. Die Waschbedingungen richten sich nach den jeweils gebun- 
denen Proteinen und der verwendeten Bank. Die Flecken, die zu identifizieren- 
den Proteinen entsprechen, werden ausgeschnitten und die an die Proteine 
gebundenenfilamentosen Phagenteilchen werden eluiert. Die ausgewahlten Pha- 
genteilchen werden entweder aufbewahrt oderzur Infektion relevanter Wirtszel- 
len verwendet, um die ausgewahlten Mitglieder der Bank zu vermehren. Alterna- 
te kann die genetische Information, die den gebundenen Mitgliedern der Bank 
entspricht, direkt mittels PCR gewonnen oder uber ihre einzigartige Codese- 
quenz identifiziert werden. 

Gemafc einer alternativen Ausfuhrungsform wird die geblottete Membran rever- 
sibel mit kolorimetrischen oder lumineszierenden Farbstoffen angefarbt und die 
gefarbten Proteinflecken werden automatisch analysiert. Die Farbe wird entfernt 
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und die Membran wird verwendet, urn die prasentierte Bank durchzumustern. 
Die nun nicht mehr sichtbaren Proteinflecken werden automatisch registriert und 
ausgeschnitten. 

GemalJ einer weiteren Ausfuhrungsform der Erfindung werden die auf die Mem- 
bran geblotteten Proteine nach einem beliebigen, einem Fachmann bekannten 
physikalisch-chemischen Verfahren zur Proteinidentifizierung identifiziert. 

Bevorzugt wird erfindungsgemaB die Identitat der interessierenden Proteine 
massenspektrometrisch (wie z.B. in Siuzdak, G., Mass Spectrometry for Biotech- 
nology, Academic Press, Inc., 1996 beschrieben) mit anschlieftender Protein- 
oder EST-Datenbankrecherche (z.B. nach Mann, M., in Microcharacterization of 
Proteins, Hrsg. R. Kellner, F. Lottspeich, H.E. Meyer, VCH Weinheim, 1994) 
identifiziert. Die Proteine werden anschlieftend im Gel enzymatisch oder che- 
misch gespalten. Der Spaltansatz kann dann als solcher vollstandig massenspek- 
trometrisch analysiert werden oder vorher mittels Mikrosaulen-Flussigchromato- 
graphie (LC) analysiert werden. Die massenspektrometrische Analyse kann auf 
verschiedene, an sich bekannte Arten durchgefuhrt werden, z.B. mit einer 
lonisierungsquelle wie einem Elektrospray (Chapman, J.R., et al., Methods in 
Molecular Biology, 61, JR Chapman Hrsg., Humana Press Inv. Totowa NJ, USA, 
1996) einschliefclich Nanoelektrospray (Wilm. M. und Mann, M., Anal. Chem. 
68, 1-8, 1996) und matrixunterstutzter Laserdesorption und lonisierung (MAL- 
Dl) (Siuzdak, G. Mass Spectrometry for Biotechnology, Academic Press Inc. 
1996) oder eine Kombination aus Massenanalysatoren wie Triple, Quadrupof, 
Flugzeit, Magnetsektor, Fourier-Transformations-lonenzyklotron-Resonanz und 
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Wenn die Peptide aus dem Spaltansatz nicht ausreichen, die Identitat des 
Proteins eindeutig aus der Datenbank zu identifizieren, kann durch eine weitere 
Fragmentierung im Massenspektrometer wie z.B. durch Zerfall nach der Quelle 
in MALDI-TOF, MS/MS (Tandem-Massenspektrometrie), MS n eine weitere Se- 
quenzinformation fur die Datenbankrecherche erhalten werden. Die Ergebnisse 
der Recherche werden dann durch Identifizieren der fur die Recherche nicht 
verwendeten Peptidfragmente im Massenspektrum bestatigt. 

Alternativ konnen die Proteine oder Proteinfamilien durch de novo-Sequenzierung 
(z.B. nach Shevchenko, A., et al.. Rapid Communications in Mass Spectrometry, 
11, 1015-1024,1997) identifiziert werden. Dazu stehen beispielsweise die 
folgenden Methoden zur Verfugung: 

1) Verwendung der MikrosauIen-LC zur Auftrennung der Peptide im Spalt- 
ansatz (Dongre, A., et al., TIBTECH, 15, 418-425, 1997), gefolgt von 
einer automatischen Datengewinnung basierend auf vorgewahlten Bedin- 
gungen und einem Computer-Algorithmus, um die Datenbank abzusuchen, 
wobei eine Korrelationsanalyse verwendet wird, um die Sequenzen der 
Datenbank dem Ergebnis der Tandem-Massenspektroskopieanalyse anzu- 
passen. Das verwendete Massenspektrometer besitzt eine Elektrospray- 
lonisationsquelle. 

2) Analyse des kompletten Spaltansatzes (Shevchenko, A., et al., Proc. Natl. 
Acad. Sci. USA, 93, 14440-14445, 1996) mittels MALDI mit verzogerter 
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Extraktion und Automatisierung unter Verwendung eines Realzeit-Fuzzy- 
logic-Algorithmus, urn die Massenspektren zu erhalten, und eines Softwa- 
re-Bindeglieds zu einer automatischen Datenbankrecherche. Proteine, die 
hier nicht identifiziert werden, werden dann einer Nanoelektrospray-Tan- 
dem-Massenspektrometrie mit Stammionenscanning (Wilm M. et al., Anal. 
Chem., 68, 527-533, 1996) unterworfen. Sequenzmarker (Mann, M., 
TIBS, 21, 494-495, 1996) werden dann zum Absuchen der Datenbank 
verwendet. 

Eine Datenbank uber die Protein-Protein-Wechselwirkung oder die Liganden- 
Zielmolekul-Wechselwirkung kann aufgrund der identifizierten Proteine oder 
Proteinkomplexe und ihrer verwandten Bindungspartner erstellt werden und ist 
ebenfalls Gegenstand der Erfindung. 

Die Figur 1 zeigt in einem FlielSschema des erfindungsgema&en Verfahrens im 
Uberblick. Die Identifizierung der getrennten Proteine kann entweder in der 
Immobilisierungs- oder der 
Trennstufe erfolgen. 

Die folgenden Beispiele erlautern die Erfindung naher ohne sie zu beschranken. 
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Beispiel 1 

A. Identifizierung der Proteine aus den Mitochondrien 

Mehr als 100 mitochondriale Erkrankungen sind bekannt. Einige dieser Erkran- 
kungen treten im Zusammenhang mit Alterungsprozessen oder neurologischen 
Prozessen auf . Beispiele hierfur sind Herzversagen, Demenz oder Schizophrenie. 
Einige dieser Erkrankungen werden durch Mutationen der mitochondrialen oder 
nuklearen DNA, die die meisten der Struktur- und Regulatorproteine der Mito- 
chondrien codiert, verursacht. Es ist somit wichtig, alle mitochondrialen Protei- 
ne zu identifizieren und ihre Expression sowohl in gesunden als auch erkrankten 
Geweben zu uberwachen. 

Im vorliegenden Beispiel wurden Mitochondrien aus gesunden Rinderherzen 
untersucht. 

Die Mitochondrien aus Rinderherz wurden gemafc Smith, AX., Methods Enzy- 
mol. 10, 81-86, 1967, prapariert. Submitochondriale Teilchen wurden daraus 
gemafS Cattell et al., Biochem J., 125, 169-177, 1971 hergestellt. Die Proteine 
wurden aus den Mitochondrien und submitochondrialen Teilchen nach dem 
Chloroform/Methanol-Extranktionsverfahren gemafc Fearnley I., und Walker, 
J.E., Biochem 26, 8247-8251, 1987 extrahiert. 

Der Chloroform/Methanolextrakt enthielt etwa 1 5 Proteine. Die verschiedenen 
Proteine wurden durch Gelfiltration uber Toyopearl HW-55 in einem Chloroform/- 
Methanol/Wassergemisch (46:46:8, bezogen auf das Volumen) mit 60 mM 
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Ammoniumacetat, pH 7 extrahiert. 

Die aufgetrennte Proteinprobe wurcle in einem Losungsmittel aus Chloroform/- 
Methanol/wafSrige Ameisensaure (4:4:1, bezogen auf das Volumen) aufgelost. 
Die Proben wurden direkt in ein Massenspektrometer uber einen kontinuierlichen 
FlielStrager aus dem gleichen Losungsmittel oder unter Verwendung der Nano- 
elektrospray-Technik (Wilm, M.S., und Mann, M., Int. J. Mass Spektrom. Ion 
Processes, 136, 167-180, 1994) injiziert. Bei der zuletzt genannten Technik 
wurden etwa 2 //I der Proteinlosung in eine goldplattierte, zu einer etwa 1//m 
Duse ausgezogene Kapillare uberfuhrt. Ein Hauptvorteil dieses Verfahrens ist der 
geringere Materialbedarf , verglichen mit herkommlicheren lonisierungsmethoden. 
Die Massenspektren wurden aufgezeichnet, und entsprechende Molekularge- 
wichte wurden berechnet. 

Die Identitat der Proteine kann mittels Tandem-Massenspektrometrie bestimmt 
werden. Aminosaureteilsequenzen wurden mit Tandem-MS mehrerer intakter 
Proteolipidionen durch Fragmentierung der Molekulionen im Massenspektrometer 
durch Kollision mit Argongas bestimmt. Aus den Massenunterschieden zwischen 
benachbarten lonen in der Reihe der Peaks in dem Massenspektrum wurde eine 
Spanne der Aminosauresequenz erhalten. Die so erhaltene Sequenz wurde dann 
verwendet, um die Sequenzen der SWISSPROT-Proteinbank durchzumustern, 
wobei das Programm PEPTIDE SEARCH (Mann, M. et al. # Biol. Mass Spec, 22, 
338-345, 1993) verwendet wurde, und die Identitat mit dem Programm MAC- 
PROMASS (Lee, T.D., und Vemuri, S., Biomed. Environ. Mass Spectrom., 19, 
639-645, 1990) bestatigt wurde. 
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Alternativ wurden die Proteine einzeln mit Trypsin gemaR Shevchenko et al., 
Proc. Nat!. Acad. Sci. USA 93: 14440-14444, 1996 gespalten. Ein Aliquot des 
Uberstands wurde entnommen und mittels MALDI-Peptidmapping analysiert 
(Shevchenko, a.a.O.). Das Programm PEPTIDE SEARCH wurde verwendet, um 
die Peptidmassenkartierung des isolierten Proteins zu vergleichen. In Fallen, in 
denen die Peptidmassenkartierung zu keiner eindeutigen Identifizierung fuhrte, 
wurden die Proben mittels Nanoelektrospray-Massenspektrometrie untersucht. 
Das Peptidgemisch wurde auf einer Kapillare aus 50 nl Poros R2-Harz (PerSepti- 
ve Biosystem, Framingham, MA) mikrogereinigt. Die Peptide wurden gewaschen 
und dann in einem Stufengradienten mit 0,5 //I 50% Methanol in 5% Ameisen- 
saure in eine Nanoelektrospraykapillare eluiert. Diese Kapillare wurde in ein 
Massenspektrometer uberfuhrt und die Probe wurde etwa 20 min verspruht. In 
dieser Zeitspanne wurden aus dem Massenspektrum hervorgehende Peptidionen 
ausgewahlt, isoliert und in der Kollisionskammer des Massenspektrometers 
fragmentiert. Aus den Tandem-Massenspektren wurden kurze Sequenzstucke zu 
Peptidsequenztags aneinandergefiigt und mit einer Proteinsequenzdatenbank 
Oder einer EST-Datenbank unter Verwendung von PEPTIDE SEARCH verglichen. 

Aus dem Enzympool in Rindermitochondrien kann Cytochromoxidase mit acht 
Untereinheiten (36, 21, 19, 14, 12,5, 11, 10 und 6 kDa) identifiziert werden. 
Die Teilsequenz der Untereinheit 2 entspricht der aus der Literatur (Tzagoloff, A., 
1982, Mitochondria, 111-130, Plenum Press New York) bekannten Sequenz. 
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B. Konstruktion der scFv- oder Fab-Bank 
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Die Sequenzen der variablen Region der leichten und schweren Ketten der 
Antikorper wurden genetisch uber eine Linkersequenz, die (Gly 4 Ser) 3 . 5 codiert, 
fusioniert (nach Clackson T. et al, Nature 352, 624-628, 1991; Ge, L. et ah, in 
C.A.K. Borrebaeck (Hrsg.) Antibody Engineering 2. Aufl., Oxford University 
Press, New York, 1 994). Alternativ kann auch eine menschliche Antikorperbank 
aus nicht immunisierten Spendern (vgl. Barbas III, a.a.O.) oder Consensusse- 
quenzen (EP-A-951 130 21) konstruiert werden. Ferner kann auch eine scFv- 
Bank, die sich von einer einzelnen Sequenz mit randomisiertem CDRH3 gemafc 
Barbas III et al., Gene, 137: 57-62, 1993 ableitet, konstruiert werden. CDRH3 
kann unter Verwendung von NNK (N= A,C,G,T in gleichen molaren Verhaltnis- 
sen, K = G und C) oder mit Codon-bezogener Mutagenese (vgl. US-A-5 264 563; 
Virnekas, B., et al., Nuc. Acids Res., 22,5600-5607,1 994) randomisiert werden. 

Die Fab-Banken wurden gemafc Huse et al., Science 246: 1275-1281, 1989 
konstruiert. 

C. Selektion von Antikorpern gegen die getrennten Proteine 

Ein Aliquot jedes der fraktionierten Proteine von Beispiel 1 wurde auf eine PVDF- 
Membran geblottet und zur Identifizierung markiert. Die Membran wurde mit 3% 
fettfreiem Milchpulver und UV-inaktivierten M1 3-Phagen blockiert. Eine auf 
einem filamentosen Phagen prasentierte scFv- oder Fab-Bank wurde mit der 
blockierten, die verschiedenen fraktionierten Proteine enthaltenden Membran 
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eine Stunde vermischt. Dann wurde die Membran ausgiebig gewaschen. Jedes 
der markierten Proteine wurde aus der Membran ausgeschnitten, und die gebun- 
denen Phagen wurden mit 0,1 M TEA oder HCI 10 min eluiert und neutralisiert. 
Alternativ wurden die ausgeschnittenen Membranstucke mit PCR-Puffer ge- 
trankt, und das Eluat wurde als Matrize fur die PCR-Reaktion unter Verwendung 
eines fiankierenden Primerpaares, das die Amplifikation der scFv- oder Fab-Gene 
erlaubte, verwendet. Die Spezifitat der auf der Oberflache des gebundenen 
Phagen prasentierten scFvs oder Fabs wurde mittels ELISA oder Western Blot- 
ting bestimmt. Alternativ wurden die amplifizierten PCR-Fragmente in einen 
Expressionsvektor subcloniert und der Rohextrakt auf Bindung mittels ELISA 
oder Western Blotting getestet. 

Beispiel 2 

A. Identifizierung der mitochondrialen Proteine aus dem 2D-Gel mittels 
Massenspektrometrie 

Die Proben aus fraktionierten mitochondrialen Proteinen wurden durch 2D- 
Gelelektrophorese getrennt. Das Gel wurde mit Coomassie angefarbt, und die 
Proteinflecken wurden mittels MALDI und Nanospray wie in Beispiel 1 beschrie- 
ben identifiziert. 

Einer der Proteinflecken wurde als Rindermitochondriengenprodukt ND2, eine 
Komponente der NADH-Dehydrogenase, identifiziert. Die N-terminale Sequenz 
stimmt mit der entsprechenden Sequenz aus der Literatur uberein (Fearnley, und 
Walker, 
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Wie in Fearnley und Walker gezeigt, codiert das Codon ATG, ein universelles 
Isoleucincodon, in Rinderherzmitochondrien sowohl bei der Initiations- als auch 
bei der Elongationsstufe Methionin. Diese Information kann nur uber die direkte 
Sequenzierung des Gens und Proteins erhalten werden. 

B. Seiektion von Antikorpern gegen die mit dem 2D-Gel getrennten Proteine 

Die 2D-Elektrophoresegele wurden auf eine PVDF-Membran geblottet und mit 
einer Phagen-Antikorperbank wie in Beispiel 2 beschrieben abgesucht. Die durch 
irreversible Anfarbung des entsprechenden 2D-Gels markierten Proteinflecken 
wurden ausgeschnitten und die gebundenen Phagenteilchen wurden wie vor- 
stehend beschrieben eluiert. 

Beispiel 3 

A. Konstruktion von Peptidbanken 

Peptidbanken wurden nach an sich bekannten Verfahren konstruiert (vgl. z.B. 
Devlin, J.J. et al., Science, 249. 404-406, 1990). Im Gegensatz zur scFv- oder 
Fab-Phagenbank konnen die prasentierten Peptide genetisch entweder mit dem 
Gen III (gill), dem Minorhullprotein von filamentosen Phagen, das fur das Andok- 
ken des Phagen an den f-Pilus von E. coli und das Durchdringen der Wirtsmem- 
bran verantwortlich ist, oder dem Gen VIII (gVIII), dem Haupthullprotein, fu- 
sioniert werden. Da pro Phagenteilchen nur 3-5 Kopien von gl lip im Gegensatz 
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zu 2-3000 Kopien von gVlllp vorhanden sind f konnen mehr Kopien des gleichen 
Peptids uber eine gVIII-Fusion als uber eine gill-Fusion prasentiert werden, sind 
die ausgewahlten Peptide als Folge des Einfangeffekts bei Prasentation auf gill 
eher hochaffine Varianten als bei Prasentation auf gVIII. 

B. Selektion der Peptide gegen die getrennten Proteine 

Die fraktionierten Proben der mitochondrialen Proteine aus Beispiel 1 wurden 
mittels 2D-Gelelektrophorese oder Saulenchromatographie getrennt. Die fraktio- 
nierten Proteine wurden wie beschrieben auf eine Membran geblottet. Die 
Membran wurde blockiert und die Phagen-Peptid-Bank wurde direkt zu der Mem- 
bran gegeben. Die fur individuelle Proteine spezifischen Peptide wurden wie in 
Beispiel 1 beschrieben isoliert. 

Beispiel 4 

A. Konstruktion einer Rinderherz-cDNA-Bank 

Eine Rinderherz-cDNA-Bank wurde von Stratagene (Kat. # 937722) bezogen und 
unter Verwendung des SurfZAP-Vektors (Stratagene) prasentiert. 

B. Selektion von cDNA gegen die getrennten Proteine 

Die fraktionierten Proben der mitochondrialen Proteine aus Beispiel 1 wurden 
mittels 2D-Gelelektrophorese oder Saulenchromatographie getrennt. Die fraktio- 
nierten Proteine wurden wie beschrieben auf eine Membran geblottet. Die 
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Membran wurde blockiert und die Phagen-cDNA-Bank wurde direkt zu der 
Membran gegeben. Die fur individuelle Proteine spezifische cDNA wurden wie in 
Beispiel 1 beschrieben isoliert. 

Beispiel 5 

A. Erzeugung kombinatorischer Rinderherzprotein-spezifischer Antikorperban- 
ken 

Rinderherzgewebe wird nach einem Fachmann bekannten Standardmethoden 
homogenisiert. Das Homogenat wird unter Verwendung einer 2D-Gelelektropho- 
rese getrennt und eine kombinatorische Antikorper-Phagenbank wird mit dem 
getrennten Homogenat in Kontakt gebracht und proteinspezifische Subbanken 
werden wie in Beispiel 2 isoliert. 

B. Identifizierung der Rinderherzproteine 

Die auf dem Gel getrennten Proteinproben werden geblottet und jeder Protein- 
fleck wird unter Verwendung von Massenspektrometrie wie in Beispiel 1 identifi- 
ziert. 

"C. Expressionsprofil der Rinderproteine unter Verwendung der immobilisierten 
Proteinproben 

Das Rinderherzhomogenat wird auf Mikrotiterplatten immobilisiert. Die Anzahl 
der Kavitaten entspricht dabei der in Stufe A erzeugten Subbanken. Nach 
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Blockierung der Kavitaten mit geeigneten Puffern werden die Antikorpersub- 
banken zugesetzt und so inkubiert, dafc ein Teil jeder Bank an das Homogenat in 
jeder Kavitat bindet. Die Kavitaten werden gewaschen und die gebundenen 
Antikorper werden durch die an die Antikorper fusionierten Peptidtags identifi- 
ziert. 

Es ist offensichtlich, daft mit geeigneten Modifikationen Proteinproben jeder 
biologischen Quelle auf jeder f esten Oberf lache immobilisiert werden konnen und 
mit Antikorper- oder Peptidbanken nachgewiesen werden konnen. Umgekehrt 
konnen auch Antikorper- und Peptidbanken auf festen Oberflachen immobilisiert 
werden, und die Proteinproben werden mit der Oberflache in Kontakt gebracht 
und durch physikalisch-chemische Verfahren wie z.B. Chemilumineszenz nach- 
gewiesen. 
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Patentanspruche 

1. Verfahren zur gleichzeitigen Iclentifizierung eines Proteinsteins eines und 
seines Bindungspartners, dadurch gekennzeichnet, daB man 

a) Proteine Oder Proteinaggregate aus einer biologischen Quelle isoliert 
und auftrennt, 

b) die aufgetrennten Proteine oder Proteinaggregate auf einer Oberfla- 
che immobilisiert, 

c) eine kornbinatorische Bank mit den auf einer Oberflache immobili- 
sierten Proteinen oder Proteinaggregaten inkubiert, 

d) diejenigen Mitglieder der kombinatorischen Bank, die an dieimmobi- 
lisierten Proteine binden, von nicht-gebundenen Mitgliedern der 
Bank trennt, 

e) die an die Oberflache gebundenen Komplexe aus Protein und Bin- 
dungspartner aus der kombinatorischen Bank isoliert, 

f) die Proteine in den so isolierten Komplexen mit einer Kombination 
aus einem physikalisch-chemischen Verfahren identifiziert, und 

g) gegebenenfalls die isolierten Brndungspartner anreichert. 

2. Verfahren nach Anspruch 1 , dadurch gekennzeichnet, dafc die biologische 
Quelle ein Organpraparat, eine Biopsieprobe, eine Korperflussigkeit eines 
Lebewesens, eine Zellkultur, ein Mikroorganismus oder ein Pflanzenprapa- 
rat ist. 



3. 



Verfahren nach einem der Anspruche 1 oder 2, dadurch gekennzeichnet, 
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date man bei Schritt a) die biologische Probe in einem geeigneten Puffer 
solubilisiert und die Probe unter Verwendung eines Proteintrennverfahrens 
ausgewahlt aus 2D-GeleIektrophorese, Perfusionschromatographie, 
Fliissigchromatographie oder Kapillarelektrophorese auftrennt. 

4. Verfahren nach einem der Anspruche 1 bis 3, dadurch gekennzeichnet, 
date man in Schritt b) die aufgetrennten Proteine auf den Kavitaten einer 
Mikrotiterplatte immobilisiert oder auf eine Membran blottet oder mit mit 
spezifischen Antikorpern beschichteten Mikrokugelchen einfangt, 

5. Verfahren nach einem der Anspruche 1 bis 4, dadurch gekennzeichnet, 
da(S man als kombinatorische Bank Random-Peptid-Banken, Banken der 
Immunglobulin-superfamilie, Protein-Display-Banken, kombinatorische 
chemische Banken, RNA- oder DNA-Banken verwendet. 

6. Verfahren nach einem der Anspruche 1 bis 5, dadurch gekennzeichnet, 
date man bei Schritt d) die gebundenen Mitglieder der Bank direkt eluiert 
oder die in die Phagenpartikel, die die gebundenen Proteine prasentieren, 
gepackte DNA mit der PGR amplifiziert. 

7. Verfahren nach einem der Anspruche 1 bis 6, dadurch gekennzeichnet, 
dafc man in Schritt g) einen bakteriellen Wirt mit den isolierten Phagen 
infiziert, urn ausgewahite Phagenteilchen zu vermehren, und die ausge- 
wahlten Proteinbindungspartner sequenziert, oder die ausgewahlten Bin- 
dungspartner durch einzigartige Sequenzanknupfungen (Tag) identifiziert. 
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8. Verfahren nach einem der Anspruch 1 bis 7, cladurch gekennzeichnet, dafc 
man die aufgetrennten Proteine oder Proteinaggregate mittels Massen- 
spektrometrie oder durch direktes Sequenzieren identifiziert. 

9. Datenbank, umfassend Proteine und ihre spezifischen Bindungspartner 
und erhalten nach einem Verfahren nach einem der Anspruche 1 bis 8. 

10. Datenbank nach Anspruch 9 zur Verwendung zur gezielten Diagnose von 
Stoffwechselerkrankungen. 

11. Verwendung einer Datenbank nach Anspruch 9 zur Entwicklung von 
Arzneimitteln, dadurch gekennzeichnet, date man mit einem Verfahren 
nach einem der Anspruche 1 bis 8 die Bindung einer Arzneimittelmodell- 
verbindung an die Proteine eines Krankheitserregers ermittelt und die so 
erhaltenen Bindungsdaten qualitativ auswertet. 

1 2. Diagnosechip, dadurch gekennzeichnet, dalS er eine nach einem Verfahren 
nach einem der Anspruche 1 bis 8 erhaltene proteinspezifische Bank oder 
Subbank eines menschlichen, tierischen oder pf lanzlichen Gewebes immo- 
bilisiert an eine Oberflache enthalt. 

13. Kit, dadurch gekennzeichnet, date es einen Diagnosechip nach Anspruch 
12 zusammen mit einer Probenahmevorrichtung, einem ReaktionsgefaB, 
Kalibrationskurven und Gebrauchsanweisung enthalt. 
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(57) Abstract 



The invention relates to a method for simultaneous identification of a protein and its binding partners, characterised in that a) proteins 
or aggregates of proteins from a biological source are isolated and separated, b) the separated proteins or aggregates of proteins are 
immobilized on a surface, c) a combinatory bank is incubated with proteins or aggregates of proteins immobilized on a surface, d) the 
members of the combinatory bank which bond with the immobilized proteins are separated from non-bonded members of said bank, e) the 
surface bonded complexes made of protein and bonding partners from the combinatory bank are isolated, f) the proteins in the complexes 
thus isolated are identified according to a mixed physical-chemical process and g) the isolated bonding partners are optionally enriched. 
The invention enables simultaneous identification of proteins with or without prior purification, and makes it possible to select members of 
combinatory banks which interact with said proteins. This allows the function of said proteins to be determined in a simple manner, using 
their specific bonding partners. 



(57) Zusammenfassung 

Die Erfindung betrifft Verfahren zur gleichzeitigen Identifizierung eines Proteins und seines Bindungspartners, das dadurch 
gekennzeichnet ist, daB man a) Proteine oder Proteinaggregate aus einer biologischen Quelle isoliert und auftrennt; b) die aufgetrennten 
Proteine oder Proteinaggregate auf einer Oberfiache immobilisiert; c) eine kombinatorische Bank mit den auf einer Oberfl ache immobilisierten 
Proteinen oder Proteinaggregaten inkubiert; d) diejenigen Mitglieder der kombinatorischen Bank, die an die immobilisierten Proteine binden, 
von nicht-gebundenen Mitgliedern der Bank trennt; e) die an die Oberflache gebundenen Komplexe aus Protein und Bindungspartneraus der 
kombinatorischen Bank isoliert; f) die Proteine in den so isolierten Komplexen mit einer Kombination aus einem physikalisch-chemischen 
Verfahren identifiziert; und g) gegebenenfalls die isolierten Bindungspartner anreichert. Die vorliegende Erfindung erlaubt somit die 
gleichzeitige Identifizierung von Proteinen mit und ohne vorherige Reinigung, sowie die Auswahl von Mitgliedern kombinatorischer 
Banken, die mit diesen Proteinen wechselwirken. Dadurch 136t sich auf einfache Weise die Funktion der Proteine Ober ihre spezifischen 
Bindungspartner ermitteln. 
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